
告别海量标注!浙大团队提出GUI-RCPO,让GUI定位在无标签数据上自我进化
告别海量标注!浙大团队提出GUI-RCPO,让GUI定位在无标签数据上自我进化无需海量数据标注,智能体也能精确识别定位目标元素了! 来自浙大等机构的研究人员提出GUI-RCPO——一种自我监督的强化学习方法,可以让模型在没有标注的数据上自主提升GUI grounding(图形界面定位)能力。
来自主题: AI技术研报
6905 点击 2025-09-05 15:28
无需海量数据标注,智能体也能精确识别定位目标元素了! 来自浙大等机构的研究人员提出GUI-RCPO——一种自我监督的强化学习方法,可以让模型在没有标注的数据上自主提升GUI grounding(图形界面定位)能力。
本文第一作者唐飞,浙江大学硕士生,研究方向是 GUI Agent、多模态推理等。